在本文中,我们评估了域转移对训练集外部数据外的数据的培训的人类检测模型的影响领域。具体而言,我们使用Robotti平台在农业机器人应用程序的背景下收集的现场数据集中介绍了Opendr人类,从而可以定量测量此类应用程序中域移动的影响。此外,我们通过评估有关训练数据的三种不同的情况来研究手动注释的重要性:a)仅消极样本,即没有描绘的人,b)仅阳性样本,即仅包含人类的图像,而c)既负面c)。和阳性样品。我们的结果表明,即使仅使用负样本,即使对训练过程进行了额外的考虑,也可以达到良好的性能。我们还发现,阳性样品会提高性能,尤其是在更好的本地化方面。该数据集可在https://github.com/opendr-eu/datasets上公开下载。
translated by 谷歌翻译
图像质量是催化性咨询成功的关键因素。但是,患者发送的图像中有多达50%存在质量问题,从而增加了诊断和治疗的时间。为了改善当前的远程咨询流量,需要一种自动化,易于部署,可解释的方法来评估图像质量。我们介绍了ImageQX,这是一种卷积神经网络,该网络训练了图像质量评估,其学习机制可确定最常见的图像质量解释:不良框架,不良照明,模糊,低分辨率和距离问题。 ImageQX在26635张照片中接受了培训,并在9874张照片上进行了验证,每张照片都有图像质量标签和不良图像质量解释的注释,最多可提供12位董事会认证的皮肤科医生。摄影图像是在2017 - 2019年间使用移动皮肤病跟踪应用程序在全球范围内访问的。我们的方法可实现图像质量评估和图像质量差的解释的专家级别的性能。为了进行图像质量评估,ImageQX获得了0.73的宏F1得分,该得分将其置于成对评估者F1分数0.77的标准偏差之内。对于差的图像质量解释,我们的方法获得了0.37至0.70之间的F1得分,类似于评分者间成对的F1评分在0.24和0.83之间。此外,ImageQX的尺寸仅为15 MB,可以轻松地在移动设备上部署。通过与皮肤科医生相似的图像质量检测性能,将ImageQX纳入远程表现流程可以减轻皮肤病学家的图像评估负担,同时减少患者的诊断和治疗时间。我们介绍了ImageQX,这是一个可以解释的图像质量评估器,它利用域专业知识来提高虚拟环境中皮肤科护理的质量和效率。
translated by 谷歌翻译
我们在新定义的触发警告分配的计算任务上介绍了第一个数据集和评估结果。标记的语料库数据是根据我们自己的档案(AO3)(一个著名的幻想网站)托管的叙事作品编制的。在本文中,我们专注于最常见的触发类型(暴力),并定义文档级二进制分类任务,即是否将暴力触发警告分配给幻想小说,并利用AO3作者提供的警告标签。通过对Corpora进行了四个评估设置培训的SVM和BERT模型,我们编制的汇编$ f_1 $结果范围从0.585到0.798,证明暴力触发警告任务是可行的,这是一项不平凡的任务。
translated by 谷歌翻译
机器学习(ML)模型与它们在分子动力学研究中的有用性相反,作为反应屏障搜索的替代潜力,成功的成功有限。这是由于化学空间相关过渡状态区域中训练数据的稀缺性。当前,用于培训小分子系统上的ML模型的可用数据集几乎仅包含在平衡处或附近的配置。在这项工作中,我们介绍了包含960万密度函数理论(DFT)的数据集过渡1X的计算,对WB97X/6-31G(D)理论水平的反应途径上和周围的分子构型的力和能量计算。数据是通过在10K反应上以DFT运行轻度弹性带(NEB)计算而生成的,同时保存中间计算。我们在Transition1x上训练最先进的等效图形消息通讯神经网络模型,并在流行的ANI1X和QM9数据集上进行交叉验证。我们表明,ML模型不能仅通过迄今为止流行的基准数据集进行过渡状态区域的特征。 Transition1x是一种新的具有挑战性的基准,它将为开发下一代ML力场提供一个重要的步骤,该电场也远离平衡配置和反应性系统。
translated by 谷歌翻译
机器学习(ML)模型与它们在分子动力学研究中的有用性相反,作为反应屏障搜索的替代潜力,成功的成功有限。这是由于化学空间相关过渡状态区域中训练数据的稀缺性。当前,用于培训小分子系统上的ML模型的可用数据集几乎仅包含在平衡处或附近的配置。在这项工作中,我们介绍了包含960万密度函数理论(DFT)的数据集过渡1X的计算,对WB97X/6-31G(D)理论水平的反应途径上和周围的分子构型的力和能量计算。数据是通过在10K反应上以DFT运行轻度弹性带(NEB)计算而生成的,同时保存中间计算。我们在Transition1x上训练最先进的等效图形消息通讯神经网络模型,并在流行的ANI1X和QM9数据集上进行交叉验证。我们表明,ML模型不能仅通过迄今为止流行的基准数据集进行过渡状态区域的特征。 Transition1x是一种新的具有挑战性的基准,它将为开发下一代ML力场提供一个重要的步骤,该电场也远离平衡配置和反应性系统。
translated by 谷歌翻译
尽管大型语言模型(LLMS)经常产生令人印象深刻的输出,但它们也无法推理和事实。我们着手研究这些限制如何影响LLM回答基于困难的问题的能力和理由。我们应用了与人类一致的GPT-3(指示程序)回答多项选择体检问题(USMLE和MEDMCQA)和医学研究问题(PubMedQA)。我们调查了思想链(逐步思考)提示,接地(通过搜索结果增强提示)和很少的射击(以问答的示例来准备问题)。对于USMLE问题的子集,医疗领域专家审查并注释了模型的推理。总体而言,GPT-3取得了最新的机器学习绩效的重大改进。我们观察到GPT-3通常是知识渊博的,并且可以理解医疗问题。 GPT-3当面对一个无法回答的问题时,仍将尝试回答,通常会导致偏见的预测分布。 LLM与人类绩效不相同,但我们的结果表明,与医疗问题解决的推理模式的出现。我们推测,缩放模型和数据,增强及时对齐方式以及允许更好地完成完成的上下文化将足以使LLMS在此类任务上达到人级的性能。
translated by 谷歌翻译
尽管人工神经网络最近取得了成功,但可能需要采用更合理的学习方法来解决经过反向传播训练的模型的弱点,例如灾难性的遗忘和对抗性攻击。尽管没有明确解决这些弱点,但提出了一项新的本地学习规则,该规则在线聚类,对要找到的群集的数量有上限,而不是固定的群集计数。与其使用正交重量或输出激活约束,而是通过相互排斥的侧向高斯神经元来实现激活稀疏性,以确保多个神经元中心不能占据输入域中的相同位置。还提出了一种更新方法,用于调整高斯神经元的宽度,如果可以通过均值和方差表示数据样本。将算法应用于MNIST和CIFAR-10数据集上,以创建过滤器,以捕获各种大小的像素贴片的输入模式。实验结果表明,在大量训练样本中学习的参数稳定。
translated by 谷歌翻译
了解哪些归纳偏见可能有助于无监督的自然场景中以对象为中心的表示是具有挑战性的。在本文中,我们系统地研究了两个模型在数据集上的性能,其中使用神经样式转移来获取具有复杂纹理的对象,同时仍保留地面真相注释。我们发现,通过使用单个模块重建每个对象的形状和视觉外观,该模型可以学习更多有用的表示形式,并实现更好的对象分离。此外,我们观察到,调整潜在空间尺寸不足以提高分割性能。最后,与分割质量相比,代表性的下游有用性与分割质量的相关性明显更大。
translated by 谷歌翻译
目的:自动化肺肿瘤定位和放射性图像分割等任务可以为放射科和其他临床人员提供宝贵的时间。卷积神经网络可能适用于这样的任务,但需要大量标记的数据训练。获得标记数据是一个挑战,尤其是在医学领域。方法:本文调查了教师学生设计的使用,利用具有不同类型监督的数据集来训练在计算机断层摄影图像上进行肺肿瘤分割的自动模型。该框架由两种型号组成:执行端到端的自动肿瘤细分的学生和在培训期间提供学生额外的伪注释数据的教师。结果:仅使用小比例的语义标记数据和大量边界框注释数据,我们使用教师学生设计实现了竞争性能。培训的型号培训的大量语义注释并没有比教师注释数据所培训的模型更好。结论:我们的结果展示了利用教师学生设计的潜力来减少注释负荷,因为可以执行较少的监督注释方案,而没有分割精度的任何实际降级。
translated by 谷歌翻译
计算病理学中的图像分析任务通常使用卷积神经网络(CNN)来解决。通过探索性迭代优化,通常通过计算昂贵并且需要大量的手动工作来选择合适的CNN架构和封闭参数。本文的目标是评估神经网络架构的通用工具如何在计算病理学中进行神经网络架构搜索和普通用例的通用工具。为此目的,我们为三个不同的分类任务进行了评估了一个本地和一个基于云的工具,用于组织学图像:组织分类,突变预测和分级。我们发现,默认的CNN架构和评估的Automl Tools的参数化已经与原始出版物相提并论。尽管额外的计算工作,但这些任务的超参数优化并未显着提高性能。然而,由于非确定性效果,从单独的自动机器获得的分类器之间的性能大致不同。因此,通用CNN架构和Automl工具可以是可行的替代方案,可以手动优化CNN架构和参数化。这将允许软件解决方案的开发人员进行计算病理,以重点努力更加难以自动化的任务,例如数据策策。
translated by 谷歌翻译